55 research outputs found

    L’apport des corpus Ă©chantillonnĂ©s aux descriptions grammaticales. L’exemple des formes contre et entre

    Get PDF
    The following article sets out to show how different kinds of sampled corpus data can be used to provide a critical view of certain descriptions given in reference works (grammars and dictionaries) which, for French, tend to concentrate on literary usage. We show how quantitative and qualitative methods can be proposed to nuance the descriptions, using the example of the forms contre and entre in four different corpora: private speech, public speech, literature, press

    Que peuvent nous apprendre en syntaxe des corpus oraux « anciens » ?

    Get PDF
    Comment peut-on s’appuyer sur des corpus oraux anciens pour dĂ©tecter certaines variations en train d’advenir dans la morphosyntaxe du français parlé ? Le prĂ©sent article revient sur la notion d’ancien appliquĂ© Ă  l’oral, et prĂ©sente quelques possibles changements dans les domaines du lexique et de la morphosyntaxe. La description s’appuie sur des enregistrements de la PhonothĂšque (1958-1979) qui sont comparĂ©s avec des corpus oraux plus rĂ©cents.How is it possible to lean on old oral corpora to identify current changes in the morphosyntax of spoken French? What does the term “old” mean when applied to oral corpora? What kind of work is it possible to do out of them? This article examines some potential lexical and morphosyntactic changes which appeared recently. Two kinds of corpora are used: the PhonothĂšque corpora (registered between 1958 and 1970) and some contemporary spoken corpora

    Ce que l’oral nous a appris sur la syntaxe du français

    Get PDF
    Le thĂšme de ce numĂ©ro offre un bon prĂ©texte pour dresser, sur quelques points, un bilan de l’intĂ©rĂȘt de l’oral pour une meilleure connaissance de la syntaxe du français. Travailler Ă  partir de donnĂ©es orales impose un certain nombre de contraintes, qu’il est peut-ĂȘtre utile de rappeler (en partie du moins). Il est, par exemple, indispensable de disposer de corpus fiables : ce qui induit que leur constitution a Ă©tĂ© prĂ©parĂ©e (il ne suffit pas de collecter des donnĂ©es au hasard pour constituer u..

    Comment les données de corpus pourraient renouveler les manuels de grammaire ?

    Get PDF
    L’exploitation de grands corpus a permis de donner un Ă©clairage neuf sur de nombreux faits de langue et d’en renouveler Ă  la fois l’analyse et la prĂ©sentation. Ce constat est indĂ©niable notamment pour l’anglais, mais en ce qui concerne la langue française ces types de travaux sont encore quasi inexistants ou bien trop parcellaires. L’objet de cet article est de montrer comment les donnĂ©es de corpus conduisent Ă  adopter un regard critique sur certaines descriptions proposĂ©es dans les grammaires ou les manuels et Ă  indiquer quels amĂ©nagements pourraient ĂȘtre apportĂ©s.The use of large corpora has brought a fresh understanding of many aspects of language and has brought renewed methods of analysis and presentation. Although this is particularly true of English, for French this type of approach is typically lacking or absent even. The aim of this article is to show how corpora can help us to develop a critical account of certain descriptions given in grammar books or manuals and can help suggest changes to these

    Partition et topicalisation : il y en a « stabilisateur » de sujets et de topiques indéfinis

    Get PDF
    L’article traite des contraintes portant sur les pronoms indĂ©finis en position sujet. L’étude est menĂ©e Ă  partir de corpus appartenant Ă  divers registres. On contraste les emplois de sujets purs avec ceux oĂč l’indĂ©fini est prĂ©sentĂ© par les structures il y en a
 qui, il y en a 
 ils. On propose d’analyser ces structures comme des stabilisateurs de la relation sujet. Leur effet est de libĂ©rer les indĂ©finis des contraintes microsyntaxiques qui grouvernent leur apparition en position sujet, notamment les traits sĂ©mantiques du verbe. Les deux constructions stabilisatrices ont cependant chacune leurs conditions propres d’emploi et ne constituent pas des variantes.This paper deals with the types of constraints bearing on indefinite pronouns in subject position in French. This study is based on the two distinct structures in which such pronouns appear is analysed: subject pronouns on their own versus presentative structures such as: il + V vs il y en a + indefinite pronoun + qui which appear as an alternative in subject or topic position specially in spoken spontaneous language. The factors governing the distribution of the indefinite in these different structures are listed. They include: syntactic structure (micro or macrosyntactic), type of indefinite pronoun, semantic features of the verbal predicate, discourse factors, register. It is shown that the presentative verbs function as “stabilizers” freeing the use of indefinite pronouns from many microsyntactic constraints

    Identifier et caractériser un genre: l'exemple des interviews politiques

    Get PDF
    International audienceHow to identify and define a genre : the example of political interviews This paper proposes a reflexion on the notion of genre in the context of linguistics based on a specific corpus and on the new tools this methodological approach offers. The corpus under examination is made of the oral language developed by politicians through interviews. The aim of this study is to show how to analyze such a corpus and how to answer the methodological questions raised by the seeking of the relevant morpho-syntaxical criteria which would then allow us to define a genre. From a comparative study between the initial corpus and others (oral and written), we propose to determine the linguistic factual elements directly related to some parts of these verbal productionsCet article propose une rĂ©flexion sur la notion de genre dans le cadre de la linguistique sur corpus et sur la mĂ©thodologie que ces nouveaux outils permettent d'envisager. Notre rĂ©flexion prend appui sur la langue orale des hommes politiques, Ă  travers des interviews. Notre objectif est de montrer comment peut ĂȘtre abordĂ© un tel corpus et quelles questions de mĂ©thode soulĂšve la recherche de critĂšres morphosyntaxiques pertinents pour cerner un genre. A partir d'une Ă©tude comparative entre le corpus initial et d'autres corpus (de langue orale et Ă©crite), nous proposons de mieux cerner les faits de langue qui relĂšvent de certaines des composantes de ces productions

    Réflexions sur les exploitations différenciées de la grammaire

    Get PDF
    Notre rĂ©flexion porte sur deux aspects en particulier : (i) les questions d’ordre mĂ©thodologique qui ont trait Ă  la constitution des donnĂ©es (sĂ©lection des sous-corpus, taille de ceux-ci, hiĂ©rarchie entre eux, etc.), et (ii) l’intĂ©gration dans les ouvrages de rĂ©fĂ©rence des rendements multiples de la grammaire.En nous fondant sur des corpus diversifiĂ©s, nous prĂ©sentons les rĂ©sultats de deux analyses linguistiques, l’une sur l’unitĂ© lexicale justement et l’autre sur la construction syntaxique du type il y en a (beaucoup) qui dansent. Ces deux objets d’étude illustrent pour l’un des disparitĂ©s importantes selon les corpus et pour l’autre une diffĂ©rence notable entre oral et Ă©crit. En parallĂšle, nous comparons nos analyses sur corpus avec les traitements proposĂ©s dans des grammaires et des dictionnaires.Notre recherche souligne qu’une description linguistique qui prend en compte l’oral non formel donne des rĂ©sultats parfois assez diffĂ©rents de ce que l’on observe Ă  l’écrit, et qu’il y a par consĂ©quent lieu de faire une place de choix au français parlĂ© non planifiĂ© dans les ouvrages de rĂ©fĂ©rence. Si l’étude fait ressortir la spĂ©cificitĂ© de l’oral non formel, elle ne remet toutefois pas en question l’unitĂ© du systĂšme. Les phĂ©nomĂšnes variationnels que nous avons observĂ©s ne nous conduisent pas Ă  formuler une hypothĂšse de type diglossique ou dialectale, mais plutĂŽt Ă  adopter une conception polylectale de la grammaireOur reflection focuses on two aspects: (i) methodological issues related to the creation of data (selection of sub-corpora, size of sub-corpora, hierarchy among them, etc.), and (ii) the integration of the multiple usages of the grammar in reference books.Based on diversified French corpora, we prĂ©sent the results of two linguistic analyzes - one on the lexical unit justement (‘precisely’) and the other on syntactic constructions like il y en a (beaucoup) qui dansent (‘there are many people who dance’). These two subjects of research illustrate important disparities according to the corpus for one and a significant difference between spoken and written French for the other. In parallel, we compare our corpus studies with the corresponding items in both grammars and dictionaries.Our study emphasizes that a linguistic description taking into account non- formal oral gives results that are sometimes quite different from what is observed in writing. So it is necessary to integrate unplanned spoken French in the reference grammars. Even if our work highlights the specificity of non-formal oral, we think that the system is unique. The facts we have observed do not lead us to formulate a “diglossic” or “dialectal” hypothesis, but rather to adopt a “polylectal” conception of grammar

    Les incidences de quelques aspects de la transcription outillée

    Get PDF
    Cet article s’inscrit dans une rĂ©flexion d’abord mĂ©thodologique (mais en montrant les consĂ©quences thĂ©oriques des choix faits lors de ces Ă©tapes) sur les premiers moments du travail sur les corpus, Ă  partir de la sĂ©lection d’un logiciel d’aide Ă  la transcription. L’interrogation majeure porte sur les enjeux et les incidences de ce que chacun des logiciels, par ses fonctionnalitĂ©s propres, donne Ă  voir du fonctionnement de l’oral, ou au contraire ne permet pas de montrer. Avec quelques exemples provenant d’un corpus recueilli en rĂ©gion parisienne, autour du discours rapportĂ©, des particules et des chevauchements, l’objectif ultime est de montrer que cette phase initiale engage dĂ©jĂ  toute une conception de la langue.This article discusses some methodological considerations which need to be adressed during the initial stages of corpus analysis, when selecting a transcription tool, in order to highlight the theoretical consequences of the choices made at this stage. The main focus of the article concerns the issues and implications of what different software tools, by virtue of their specific characteristics, reveal or on the contrary do not reveal about the way speech operates. The analysis is illustrated by examples drawn from a corpus of Parisian French around features such as reported speech, particles, and overlaps. It is argued that this initial stage already involves an entire conception of the language

    Spoken Corpora Good Practice Guide 2006

    Get PDF
    International audienceThere is currently a vast amount of fundamental or applied research, which is based on the exploitation of oral corpora (organized recorded collections of oral and multimodal language productions). Created as a result of linguists becoming aware of the importance to ensure the durability of sources and a diversified access to the oral documents they produce, this Guide to good practice mainly deals with “oral corpora”, created for and used by linguists. But the questions raised by the creation and documentary exploitation of these corpora can be found in numerous disciplines: ethnology, anthropology, sociology, psychology, demography, oral history notably use oral surveys, testimonies, interviews, life stories. Based on a linguistic approach, this Guide also touches on the preoccupations of other researchers who use oral corpora (for example in the field of speech synthesis and recognition), even if their specific needs aren’t consistently dealt with in the present document

    Corpus oraux, Guide des bonnes pratiques 2006. Version allemande

    Get PDF
    International audienceViele Grundlagen- oder angewandte Forschungen beruhen zur Zeit auf der Auswertung von „Korpora der gesprochenen Sprache“ (geordneten Sammelwerken der Aufnahmen von mĂŒndlichen und multimodalen sprachlichen Produktionen). Dieses Handbuch der guten Praktiken entsteht aus der Erkenntnis von Sprachwissenschaftlern, die darauf bedacht sind, den Fortbestand der Quellen und einen verschiedenartigen Zugang zu den mĂŒndlichen von ihnen produzierten Produktionen zu sichern ; es schneidet zuerst die „Korpora der gesprochenen Sprache“ an, die von Sprachwissenschaftlern und fĂŒr sie geschaffen und verwendet wurden. Die durch die Erschaffung und die dokumentarische Auswertung dieser Korpora hervorgerufenen Fragen trifft man aber in vielen FĂ€chern : die Völkerkunde, die Anthropologie, die Soziologie, die Psychologie, die Demographie, die mĂŒndlich ĂŒberlieferte Geschichte gebrauchen vor allem die verbale Befragung, die Aussage, das Interview, die Lebensgeschichte. Dieses Handbuch beruft sich auf das Verfahren der Sprachwissenschaftler, es stimmt aber mit den BeschĂ€ftigungen anderer Forscher ĂŒberein, die Korpora der gesprochenen Sprache (z. B. in Sprachsynthese und -entzifferung) gebrauchen, auch wenn ihre spezifischen BedĂŒrfnisse im vorliegenden Dokument nicht systematisch angeschnitten werden
    • 

    corecore